草庐IT

MySQL CSV 导入 : datetime value

全部标签

mysql - 使用 hadoop 将数据从 Mysql 导入到 hdfs 时出错?

我正在尝试使用hadoop将数据从Mysql导入到hdfs,并尝试创建表和数据库是hive。我正在尝试使用以下命令sqoopimport--connectjdbc:mysql://localhost/Mobile--usernameroot--password12345678--tableAccesories--target-dir/user/harsh/Mobile1--fields-terminated-by","--hive-import--create-hive-table--hive-tablemob.custMobile是我的数据库,Accessories是我要导入的表。E

mysql - Sqoop:从 MySQL 导入 Hive 时替换字符?

当从MySQL导入数据到Hive时,我需要在电话号码中删除两个字符+7。以下请求返回SQL错误。我应该使用什么正确的replace命令?sqoopimport--connectjdbc:mysql://server/db--usernamexxxx--passwordyyyy--query'selectname,last_name,email,second_name,Replace(personal_phone,'+7',''),Replace(mobile,'+7',''),Replace(phone,'+7','')来自$CONDITIONS'--target-dir/data/t

hadoop - Sqoop 以 avro 格式导入日期数据类型

**我的问题是日期少了两天在SQLServer中,日期为2015-06-12(日期类型为日期),它被转换为hive表avro格式的字符串值为2015-06-10。使用的脚本。sqoop导入--connect"xxx"--query'select*fromdbo.tableNameWHERE$CONDITIONS'--target-dirxxx--fields-terminated-by'\001'--split-bytableName.columnName1-m8--as-avrodatafile--compression-codecsnappy--map-column-javacol

hadoop - 将多个数据库中的表导入 Hadoop 和 Union

我有这个特定的场景:SQLServer中有按年命名的数据库,其命名类似于“FOOXXYY”,其中XXYY表示财政年度。现在我想从所有这些数据库中取出一个特定的表“bar”,将其联合到配置单元中的单个表中并将其存储到HDFS中。最好和最快的方法是什么? 最佳答案 您需要创建数据库、创建分区表、添加分区、运行4个不同的sqoop命令以连接到每个数据库并将数据加载到分区中。以下是示例代码片段。这样创建数据库,然后分区表;CREATETABLE`order_items`(`order_item_id`int,`order_item_orde

hadoop - 使用kite-dataset导入数据时如何避免IO错误?

我在Ubuntu14上使用HortonworksHDP发行版(2.4)下载的风筝数据集运行这个命令:./kite-dataset-vcsv-import--delimiter'|'ml-100k/u.itemmovies出现此错误:WARNING:Use"yarnjar"tolaunchYARNapplications.SLF4J:ClasspathcontainsmultipleSLF4Jbindings.SLF4J:Foundbindingin[jar:file:/usr/hdp/2.4.2.0-258/hadoop/lib/slf4j-log4j12-1.7.10.jar!/or

hadoop - 增量导入没有主键的 Oracle 表到 HDFS

我的Oracle数据库有近300个表,其中200个表没有任何主键,很少有表有复合主键。我的要求是以增量方式将所有表数据导入HDFS。你能告诉我如何使用Sqoop实现这一点吗?如果建议任何其他选项,这将非常有帮助。 最佳答案 不幸的是,无法识别更新的行(您表示您不跟踪更新时间戳),这使得使用增量加载来捕获更改实际上是不可能的。一些可能性:添加时间戳满载使用行号来识别新记录,不处理更新的记录 关于hadoop-增量导入没有主键的Oracle表到HDFS,我们在StackOverflow上找到

hadoop - Sqoop 根据列值导入as-parquetfile

所以我正在尝试运行一个sqoop导入作业,在其中我根据我的partition_key保存parquet文件。最终,我希望我的文件夹/TABLE_DIR/有5个Parquet文件,每个唯一分区键1个。目前我只有4。我无法设置num-mappers5。Table2partition_key可能会上升到8,为此我想获得8个Parquet文件等。Table1:primary_key:[1,2,3,4,5,6,7,8,9,10]partition_key:[1,1,1,2,2,2,3,3,4,5]value:[15,12,18,18,21,23,25,26,24,10]Code:sqoopimp

mysql - 使用Oracle Loader将HBase数据导入Oracle表

我在HBase表中有数据,我正试图将其导入到Oracle或MySQL表中。我听说有一个OracleLoader可以达到这个目的。有人试过将HadoopHBase数据导入Oracle表吗?如果是这样,能否请您提供一个引用链接,告诉我如何做到这一点? 最佳答案 我不知道你是怎么做到的。上次我检查过不支持通过Sqoop从HBase导出到SQLDB。由于这个事实,您正面临这个问题。你可能会尝试:将HBase数据导出到HDFS,然后将其导出到Oracle。将HBase表映射到Hive并进行导出。我也不太确定Oracle数据加载器是否支持HBa

mysql - Sqoop:增量导入问题

我有一个要求,其中我需要从mysql中导入一个表以增量方式配置单元,并且在这样做时遇到了问题。到目前为止,这是我尝试过的:我已经创建了一个作业来使用下面提到的查询导入表。/sqoop作业--createtest2--import--connectjdbc:mysql://URL--usernameusername--passwordpassword--tablemysqlTablename--hive-import--hive-overwrite--direct--incrementallastmodified--check-columnlast_modified_time--last

hadoop - 从vertica导入数据到hive

我尝试使用Sqoop将数据从Vertica上传到Hive。我可以看到它在HIVE上创建了一个文件和一个表,但是当我尝试从HIVE或文件中选择数据时,我看不到数据。它向我显示错误(文件列上没有分隔符)选择。这是我的代码:sqoopimport-m-1--drivercom.vertica.jdbc.Driver--connect"jdbc:vertica://serverName:5443/DBName"--username"user"--password"pass"--query'selectid,namefromcontactslimit10'--target-dir"folder/